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Решение задачи распределения нагрузки 
в двухпроцессорной системе на основе 
нейронных сетей" 


В статье рассматривается планирование распределения потока не связанных между собой задач в 
многопроцессорной системе. Предлагается подход, основанный на использовании ассоциативных 
нейронных сетей. В случае двухпроцессорной системы его применение полностью решает поставленную 
задачу за О(М)) операций. 


Введение 


В последние годы широко и все более быстрыми темпами осуществляется 
разработка, выпуск и внедрение в автоматизированные системы обработки инфор- 
мации и управления, вычислительные центры и вычислительные сети разнообразных 
многопроцессорных и многоядерных вычислительных систем (МВС). Такие вы- 
числительные системы отличаются повышенной гибкостью и характеризуются высо- 
кими, а в ряде случаев — рекордными показателями производительности, объемов 
внутренней памяти, готовности, надежности и живучести. 

Программирование для многопроцессорных и многоядерных систем связано с 
распараллеливанием и синхронизацией вычислений и с организацией выполнения 
параллельных процессов. Это выдвигает целый ряд сложных задач, среди которых 
весьма важными являются расчет характеристик времени и количества операций, 
требующихся для выполнения параллельных программ, и построение расписаний 
(планов) выполнения параллельных программ на многопроцессорных и многоядер- 
ных вычислительных системах. 

Одной из проблем, возникающих при функционировании МВС, обрабаты- 
вающих потоки задач, является балансировка нагрузки [1-6], т.е. проблема дина- 
мического распределения ресурсов системы (процессоров, ядер) по задачам потока 
таким образом, чтобы все процессоры (ядра) системы были загружены равномерно. 
Недостатки в функционировании МВС привели к созданию систем управления 
ресурсами (СУР), типичная схема которых приведена на рис. 1. 

Она включает в себя следующие функции: 

— миграция задач по узлам МВС; 
— создание и функционирования множества очередей; 
— планирование вычислений. 


* Работа поддержана грантом РФФИ (06-01-00109). 
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В свою очередь, планирование вычислений определяется с помощью следующих 

методов: 

— перечислительные, переборные методы [7]; 

— теоретико-графовые методы [8]; 

— методы математического программирования [7], или динамического программи- 
рования [9]; 

— методы теории очередей [10]. 

Однако применение перечисленных методов при динамическом планировании вы- 
числительного процесса ограничивается их высокой вычислительной сложностью [11]. 

В этой связи возникает актуальная задача — создать такие методы распре- 
деления потока задач, с помощью которых можно было бы оптимизировать это распре- 
деление и обеспечить надежность функционирования в условиях деградации ресурсов 
системы. 

Конкретный алгоритм, реализуемый планировщиком (рис. 1), в распреде- 
ленных системах выполняет функцию управления ресурсами. Когда речь идет о 
планировании вычислений, т.е. об определении порядка выполнения процессов и работ, 
то нужно иметь в виду, что эта задача предполагает и назначение — распределение 
доступных ресурсов между процессами и работами. 


Назначение 
на ресурсы 


Менеджер ресурсов 


Обновленные 
данные о состоянии 


Очередь ресурсов 


работ 


апросы апросы 
пользователей пользователей 


Процессорные узлы 


Рисунок 1 — Типичная структура системы управления ресурсами 


В данной работе рассматривается метод, основанный на применении ассоциатив- 
ных нейронных сетей Хопфилда [12] в алгоритме балансировки нагрузки. 


Постановка задачи 


Пусть имеется система, содержащая Л процессоров одинаковой производи- 
тельности Г, на которую поступает поток из не связанных между собой М задач, 
каждая из которых имеет вычислительную сложность Н,(1=1...М). Тогда время 


выполнения процессором {-ой задачи задается выражением 
т=Н,/Т. 
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Под оптимизацией распределения задач из потока по процессорам МВС будем 
понимать минимизацию времени Т выполнения всех задач [1], которое определяется 
следующим выражением 


Тешах {Л.П (1) 


где Т,— время выполнения /-ым процессором своего подмножества задач. Напри- 


мер, если а,Б,...с- номера задач, подлежащих исполнению на /-ом процессоре, то 
это время определяется как 


Г; = та +ть +... с. 


Необходимо найти такое разбиение множества задач потока по процессорам, 
чтобы значение времени Т (1) было минимальным. 


Переформулировка постановки задачи 


Пусть С - какое-то распределение задач по процессорам МВС. Это распре- 
деление характеризуется временным параметром 


ТЕТ) Ра 


Для каждого распределения С можно вычислить дисперсию времен выполнения: 
где 


Тогда между параметрами о’и Т имеется связь, о чем и свидетельствуют 
результаты экспериментов. Так на рис. 2 и 3 представлены результаты численного 
эксперимента, в котором один и тот же набор из 20 случайных задач фиксированных 
сложностей Н = [.. аа 0] 10000 раз случайным образом «разбрасывался» по 4 одина- 
ковым процессорам. Для каждого распределения задач по процессорам вычислялись 
время выполнения Т и значение дисперсии о” и эти данные наносились на график. 
Видно (рис. 2), что для одного и того же значения Т имеется несколько значений 


Е К 
дисперсии с”, однако среднее значение дисперсии о* = Ту? монотонно растет 
1=1 
с увеличением Т. На рис. 3 показана зависимость среднего значения о” от времени 
выполнения. Видно, что (усредненное по реализациям) значение дисперсии о” 
связано монотонной зависимостью со временем выполнения Т. 

Для подтверждения такой зависимости было проведено более 1000 анало- 
гичных компьютерных экспериментов, в которых число процессоров изменялось от 
2 до 10, а сложность наборов задач М Е [6; 20]. В этих экспериментах были полу- 
чены схожие результаты, что позволяет нам перейти от минимизации величины Т к 
минимизации дисперсии д”. 
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Отдельный интерес представляет случай распределения потока задач на двух 


одинаковых процессорах, поскольку: 


2 > > 
1. В этом случае величина о’ является однозначной функцией времени 
выполнения (рис. 4) и ее уменьшение автоматически приводит к уменьшению Т. 
В оставшейся части работы рассматривается система, состоящая из двух процес- 


соров одинаковой производительности. 


2. Этот алгоритм можно использовать в задаче оптимального управления 


ресурсами МВС, когда число процессоров больше 2. 


3. Предложенный подход, основанный на использовании ассоциативных нейрон- 


ных сетей, полностью решает поставленную задачу за ом ) операций. 
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Рисунок 2 — Зависимость дисперсии от времени выполнения: 4 процессора 
одинаковой производительности; 20 задач, вычислительная сложность которых 
Н = {4;6;8;10;3;3;8;3;5;3;8;10;9;1;1;6;7;4;57;5;3} ; число экспериментальных точек равно 10000 
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Рисунок 3 — Зависимость среднего значения о° и ее среднеквадратичное отклонение 


от времени выполнения 
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Рисунок 4 — Зависимость ос” от времени выполнения: 2 процессора одинаковой 
производительности; 10 задач, вычислительная сложность которых 
Н={7;4;1;6;7;10;8;8;3;3;} 


Далее мы отдельно рассмотрим случаи с двумя процессорами. 


Модель нейронной сети 


Пусть Т, и Т, - времена выполнения первым и вторым процессорами своих 
задач соответственно. Обозначим принадлежность 1-ой задачи к одному из двух 
одинаковых процессоров заданием бинарной переменной у, (координаты): если 


у; =1, то задача подается на первый процессор, если у, =0 — на второй. В этих 


2. 
обозначениях выражение для дисперсии о имеет вид: 


= -т,} =| У @»,-пн, |. (2) 


Л 
Или, после некоторых преобразований, 


м м 2 м 
д? = соп5й + У Ах. = [:н») -У(Нл,), (3) 


1] = 
где 


0, [=] 


х,=2у, 1, х, ={-1+1, у, =0. 


2 
Отметим, что выражение (3) для дисперсии о” совпадает с определением 
понятия энергии в нейросетевой модели Хопфилда [12], где в качестве (м хм ) -матрицы 
связей выступает матрица А,. Поэтому поиск минимума квадратичного функцио- 


нала (3) по бинарным переменным х; ведется с помощью стандартной нейросетевой 
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процедуры. Для данной структуры матрицы связей А„ динамика сети Хопфилда следую- 


щая: состояние к -ого нейрона в момент времени (1+1) определяется в соответствии с 
правилом Хопфилда: 


х, (#+1) = -я1(5() - Н,х, (0) К=Ь,....М. 
С последующей модификацией 
5+0 =5(0-Н,х,(Ю+Н,х, (1+1. 


Тем самым представленная выше динамика позволяет уменьшить в М раз 
число операций, которое теперь составляет ом ). 


Компьютерное моделирование, эксперименты 
(дискретный случай) 


Высокая скорость метода нейросетевой оптимизации обусловила его приме- 
нение в задаче планирования распределения потока задач в МВС. Однако его 
непосредственное применение (как и всякий итерационный метод) дает результаты 
только при удачном выборе начального состояния, с которого система должна 
стартовать. Это обусловило создание метода для выбора начального состояния, с 
которого стартует нейросетевой алгоритм. Поэтому при компьютерном моделиро- 
вании распределения потока задач в МВС использовались 3 метода, а именно: 

1. Метод выравнивания, который решает задачу выбора начального состояния 
нейронной сети. Алгоритм метода заключается в следующем: 

а) определяем Т, — приближенное значение минимального времени выпол- 


нения, разделив пополам сумму всех времен исполнения задач; 
6) на первый процессор подаем задачи до тех пор, пока их суммарное время 
выполнения не превысит значения Т, ; 


в) оставшиеся задачи подаются на второй процессор. 

2. Случайный поиск — многократный поиск минимума функционала (3) с 
помощью нейронной сети Хопфилда, в процессе которого отбирается состояние с 
наименьшим значением дисперсии о”. Начальная точка старта (распределение задач 
по процессорам) выбирается случайно. 

3. Модифицированный метод балансировки нагрузки — начальное распреде- 
ление задач по процессорам определяется методом выравнивания. С полученного 
состояния стартует нейронная сеть. 

Для получения статистически значимых результатов эксперименты прово- 
дились сериями по 1000 наборов задач при фиксированном количестве М задач в 
наборе и заданном диапазоне О (т.е. сложность задач Н, — это случайные целые 
числа в диапазоне от 1 до О). Затем серия повторялась для других значений М и 
О, значения которых О =10, 100; М =15, 20, 60. 

Предварительно для каждого набора задач методом полного перебора отыски- 
вался глобальный минимум функционала (3), с которым и сравнивались результаты 
метода выравнивания, метода случайных стартов и модифицированного метода. 
Результаты проведенных экспериментов приведены на рис. 5 и рис. 6. 
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На рис. 5 показаны графики вероятностей нахождения решений как функции 
расстояния от глобального экстремума при О =10,М = 20. Для сравнения, на рис. 6 
приведены аналогичные графики, при Ор =10, М =15. 


Вероятность 
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Рисунок 5 — Вероятность нахождения минимума для М =20, О =10 тремя 
методами (кривая | — метод выравнивания; кривая 2 — метод случайного поиска; 
кривая 3 — модифицированный метод балансировки нагрузки) 


На всех графиках по оси абсцисс отложена переменная А, равная расстоянию до 


глобального минимума в единицах ДО, т.е. А = (ат —аь )/ р, где АТу - разница времен 


выполнения для оптимального распределения, АТ — разница времен выполнения для 
найденного распределения, А характеризует асимметрию загрузки процессоров. 
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Рисунок 6 — Интегральная вероятность Р{А <х } ‚ т.е. вероятность, что асимметрия 


загрузки меньше Х (кривая | — метод выравнивания; кривая 2 — случайный поиск; 
кривая 3 — модифицированный метод балансировки нагрузки) 
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Как показали эксперименты (рис. 5), непосредственное использование сети Хоп- 
филда в методе случайных стартов дает лучшие результаты по сравнению с методом 
выравнивания. И в тоже время комбинация методов выравнивания и Хопфилда дает еще 
более сильные результаты. Этот результат нетривиальнен, так как метод Хопфилда имеет 
1000 стартов на одном наборе задач, а само по себе применение «выравнивания» не 
эффективно. Действительно, вероятности найти оптимум на расстоянии А < 0,4 следую- 
щие: метод выравнивания = 0,35 ; метод случайных стартов = 0,9; модифицированный 
метод = 1. И для сравнения с предыдущим, вероятности на расстоянии х < 0,2 следую- 
щие: 0,22; 0,8; 1. Серия этих экспериментов проводилась при условии, что число задач 
больше величины диапазона 0), т.е. М >О. 

На рис. 6 приведены результаты экспериментов (другой предельный случай), когда 
число задач М = 20 значительно меньше величины диапазона О = 100. По оси абсцисс 
отложено значение безразмерной переменной А = (ат А )/ р (см. выше). По оси 


ординат отложена вероятность того, что найденный минимум находится на расстоянии 
меньшем Х, т.е. РА <х ы Кривые 1, 2, 3 соответствуют разным методам поиска 
минимума: методу выравнивания, методу случайных стартов, модифицированному 
методу. И в этом предельном случае модифицированный метод (кривая 3) имеет 
значительное преимущество перед остальными (кривые | и 2). Для метода выравнивания 
отклонение по энергии от глобального минимума не превышает = 1,6) ‚ в то время как 
отклонение по энергии для модифицированного метода не больше = 0,4). 

Сравнение результатов экспериментов для разных значений О и М показы- 
вает приблизительно одинаковые результаты. Поэтому, используя результаты экспе- 
риментов, были определены математические ожидания величины А: 

ат - аТ, = 0,700) для метода выравнивания, 


ат —аТ, = 0126) для метода случайных стартов, 
ат —аТ, = 0,065р для модифицированного метода. 


Компьютерное моделирование, эксперименты 
(непрерывный случай) 


Аналогичные предыдущему разделу эксперименты проводились и для непре- 
рывного случая, т.е. в качестве сложности задач брались случайные вещественные 
числа в диапазоне от 0 до | с точностью 7 -— 8 знаков после запятой. Эксперименты 
проводились на двух методах: случайный поиск и модифицированный метод 
балансировки нагрузки. Для выбора начальной точки модифицированного метода 
использовался метод выравнивания. Было сгенерировано случайным образом по 
100 наборов с различным количеством задач, т.е. М = 20; 100; 500. Также менялась 


минимальная сложность задач, т.е. Н‚®(0;1), где Р=0; 0,3; 0,6; 0,9. На каждом 


наборе проводилось по 100000 стартов. Так как вычисление глобального минимума в 
данном случае невозможно, то в экспериментах мы будем следить за величиной 


1 М 
К=Т-Ъ=Т --УН ‚› где Т, - приближенное значение минимального времени 
1=1 
выполнения. 
На рис.7 изображена спектральная плотность минимумов для М =20 и 
р =0: 0,3; 0,6; 0,9. 
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Рисунок 7 — Плотность отыскания минимума для различных значений минимальной 
сложности задач при М =20 


Средние значения величины А и значения дисперсий для описанного экспе- 
римента приведены в табл. 1. 


Таблица 1 — Средние значения А и ее дисперсия для различных минимальных 


сложностей задач в наборе при М = 20 
Минимальная Модифицированный метод Случайный поиск 
сложность Среднее Дисперсия Среднее значение | Дисперсия 
задач, О значение 

0 0,0339 0,0013 0,0338 0,0012 
0.3 0,1056 0,0031 0,1056 0,0031 
0.6 0,1670 0,0095 0,1678 0,0095 
0.9 0,0517 0,0015 0,0512 0,0015 
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Интересно, что «пики» на графиках приходятся в точки А = 0/2. К сожалению, 
эксперименты в непрерывном случае показали, что выбор начального приближения не 
дает практически никакого преимущества над случайным поиском (табл. 1). Возможно, 
это связано с большой плотностью локальных минимумов. 


Выводы 


В работе были предложены алгоритмы на основе нейронных сетей, решающие 
задачу распределения нагрузки в двухпроцессорной системе. 

Использование нейросетевой минимизации при старте со случайной точки в 
конфигурационном пространстве вектора х не гарантирует успеха. Для получения 
результата, сопоставимого с модифицированным методом балансировки нагрузки, 
необходимо не менее 100 стартов. 

Модификация метода балансировки, когда нейросетевая минимизация соче- 
тается с целенаправленным выбором стартовой точки, позволяет получить заметно 
лучшие результаты в дискретном случае, но, к сожалению, не дает практически 
никаких преимуществ в непрерывном случае. 

Решение задачи достигается малым объемом вычислений о(м ) ‚где М - размер- 
ность задачи. В большинстве методов на основе сети Хопфилда объем вычислений сос- 


тавляет ом : ). 
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Виришення завдання розподлу навантаження у двопроцесорний систем! на основ! нейронних мереж 

У стати! розглядаеться планування розподлу потоку не пов’язаних мж собою завдань у багатопроцесорнйй 
систем!. Пропонуеться шдхд, що трунтуеться на використанн! асощативних нейронних мереж. У випадку 
двопроцесорно! системи його застосування Шлком вирипуе поставлене завдання за О(М) операщй. 


М.У. Кгузйапоу$Ку, М.О. МаГ’»агоу 

РгоШет Зошйоп о? О5аийоп З@геат оЁТазК$ ш Зует у Тууо Ргосе$$ог$ Вазед оп Меига! Мебуогк$ 
ш Ще рарег а зсВедаПп» 15а йоп збеатл оР 415арреаге4 {азК$ ш шиЯргосеззог зузет ргоет 1$ 
сопз14егеа. ТВе арргоасВ \/шсь Базе оп Фе аззостайуе пеига| пеб\\огК 1$ ргорозе4. ш Фе зу$ет \ИВ мо 
ргосеззогз, 1$ тео зо[Уез Ве ргоМет ш О(М) орегаНопз. 
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